Recherche d'information. Analyse des résultats de différents systèmes réalisant la même tâche
نویسندگان
چکیده
RESUME: Les systèmes de recherché d’information visent à optimiser les résultats qu’ils fournissent en réponse à une requête de l’utilisateur. Les performances de ces systèmes sont généralement mesurées par rapport à des collections de test communes, comme les collections de TREC (Text REtrieval Conférence). Cette évaluation est réalisée de façon globale, en calculant une moyenne des résultats sur un ensemble de cinquante requêtes. Ainsi, la valeur ajoutée des différentes techniques utilisées par tel ou tel système n’apparaissent pas clairement. Cet article vise à étudier plus finement les résultats obtenus dans une tâche de recherche d’information et répond aux questions suivantes : les requêtes peuventelles être classifiées? Y atil une corrélation entre les performances des systèmes sur les différentes requêtes ? La tâche choisie est celle de recherche de passages pertinents et/ou nouveaux. Nous montrons que les variations dans les résultats sont plus corrélées aux outils qu’à leurs différentes versions. ABSTRACT : Information retrieval systems aim at answering users’ needs. Information Retrieval System performances are evaluated using benchmark collections such as TREC (TExt Retrieval Conference) collections. Evaluation is generally based on global evaluation, computing average results over a set of fifty queries. Doing so, the added value of the different techniques used is not easy to show. This paper aims at studying in more details results obtained in a IR task that answers the following questions: can queries be classified? Is there correlation between system performances and queries? The IR task we chose is passage retrieval and novelty detection. We show that variations in results more related to systems than to system versions. MOTSCLES: Recherche d'information, recherche de passages, détection de la nouveauté, analyse de résultats, typologie de requêtes, analyse factorielle
منابع مشابه
Fusion de systèmes pour la recherche de passages dans des textes
RÉSUMÉ Les systèmes de recherche d’information (RI) présentent une grande variabilité dans la liste des documents qu’ils retrouvent en réponse à une même requête. Dans cet article nous étudions l’apport de la fusion des résultats des systèmes pour la RI. Ainsi, nous utilisons les résultats obtenus sur un ensemble de 50 requêtes par différents systèmes qui ont participé à la tâche TREC de sélect...
متن کاملDistinguer les requêtes pour améliorer la recherche d'information XML
RÉSUMÉ. Cet article s’appuie sur une méthode de recherche d’information dans des collections de documents XML. Cette approche est configurable dans le but de pouvoir s’adapter à différents contextes de recherche. Au regard des résultats obtenus lors de différentes campagnes d’évaluations, l’efficacité de la méthode est inégale d’une requête à l’autre. De plus, différentes configurations de la m...
متن کاملAnalyse des paramètres de recherche d'information: Etude de l'influence des paramètres sur les résultats
Résumé. Cet article présente une analyse détaillée d’un ensemble de 2 millions de résultats de recherche d’information obtenus par différents paramétrages de systèmes de recherche d’information. Plus spécifiquement, nous avons utilisé la plateforme Terrier et l’interface RunGeneration pour créer différentes exécutions (run en anglais) en modifiant les modèles d’indexation et de recherche. Nous ...
متن کاملPERCIRS: a PERsonalized Collaborative Information Retrieval System
RÉSUMÉ. Pendant que le volume d'information augmente, l'importance de la recherche d’information augmente. La CIR (Collaborative Information Retrieval) est l'une des approches conventionnelles dans les systèmes de recherche d’information. Un système de CIR enregistre les interactions des utilisateurs pour répondre aux questions suivantes plus efficacement. Mais les buts et les caractéristiques ...
متن کاملNouvelles perspectives en extraction d'information
Les techniques dites d'extraction d'information (EI) ont connu un essor considérable ces dix dernières années. L'EI consiste à extraire de documents des informations précises et à les structurer sous une forme prédéfinie. Il s'agit en général de remplir des formulaires donnant certaines caractéristiques concernant des entités ou des événements évoqués dans les textes ainsi que des relations ent...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Ingénierie des Systèmes d'Information
دوره 10 شماره
صفحات -
تاریخ انتشار 2005